#AI 耳機
曝OpenAI 首款硬體定名「Dime」,壞消息:成本太高,9月首發只有「閹割版」
OpenAI 的硬體產品,真的要來了,但可能會是個「閹割版」。據智慧皮卡丘最新爆料,OpenAI 首款面向消費者的 AI 耳機命名將定為「Dime」(即 10 美分硬幣),大概也是形容其極度小巧精緻。與此同時,其相關硬體產品的專利申請已於昨日在國家智慧財產權局(CNIPA)正式公示,意味著我們很快就能看到這款裝置的真容。不過在產品策略上,OpenAI 不得不做出妥協。受限於 HBM 短缺導致 2nm 晶片成本過高,原計畫中帶有計算單元的「類手機」全能形態已被推遲。目前的計畫是先在 2026 年推出一款純音訊功能的簡版耳機,待元件成本下降後,才會發佈配置更強的高級版本。「Dime」是就此前曝光的 OpenAI 音訊裝置項目,代號為「Sweetpea(甜豌豆)。這絕不是一款普通的耳機,此前根據供應鏈消息, 這款裝置的硬體設計被形容為「獨特且前所未見」:它意在取代 AirPods,不採用骨傳導,而是使用了更接近手機等級的用料。主處理器目標直指 2nm 智慧型手機級晶片(Exynos 方案呼聲最高)。主體採用金屬材質,外形類似卵石。內部藏有兩顆可取出的膠囊狀耳機,佩戴方式獨特,是置於耳後,而非傳統的入耳。正在開發定製晶片,目標是讓裝置能通過語音直接執行 iPhone 上的 Siri 指令,打通生態壁壘。據悉在內部,這塊裝置被 Jony Ive 團佇列為最高優先順序。OpenAI 對其寄予厚望,按照計畫產品將在 9 月左右發佈,首年出貨量目標竟高達 4000 到 5000 萬台。而且富士康已接到通知, 需在 2028 年第四季度前為 OpenAI 五款裝置做好產能準備。為什麼做大模型和 AI 軟體的 OpenAI 非要死磕這種高成本的硬體?OpenAI CEO Sam Altman(山姆· 奧特曼)就曾在紐約的一場午餐會上直言:大家別盯著 Google 了,OpenAI 真正的宿敵,是蘋果。在他看來,未來 AI 的主戰場不在雲端,而在終端。Altman 認為,現在的智慧型手機根本承載不了真正的 AI 伴侶體驗——螢幕太小、互動方式太侷限、隱私保護機制太僵化。誰能率先打造出「AI 原生裝置」,誰就能在下一個十年佔據制高點。「智慧型手機是時代廣場,資訊轟炸、注意力粉碎。OpenAI 要做的,是一間『湖畔小屋』——讓你在需要專注時,能關上門,遮蔽噪音。」Altman 如此形容他對硬體的願景。在這個願景下,除了這顆被寄予厚望的「甜豌豆」耳機,一支神秘的智能筆,也在核心考慮之中。當科技巨頭們正扎堆把 AI 塞進眼鏡、手錶時,過去一年 CHatGPT 市場份額不斷被蠶食的 OpenAI ,也開始了一場新的入口爭奪之戰。OpenAI 花 65 億美元 就是為了造支筆?供應鏈爆料雖然明確,但「AI 筆」這個答案仍讓人半信半疑——直到我們把 Altman 和 Ive 過往透露的線索串聯起來,才發現這個看似離奇的猜想,實則有跡可循。去年 5 月,OpenAI 砸下 65 億美元收購由 Jony Ive 創辦的硬體公司 io,後續卻因商標糾紛(遭音訊公司 iyO 起訴)被迫剝離品牌。io 聯合創始人兼首席產品官 Evans Hankey 在法庭聲明中明確表態:「io 目前並無推出定製耳機的計畫。」另一位聯合創始人 Tang Tan 則直接劃清界限:io 產品原型既非入耳式裝置,也不是可穿戴裝置。圖片源自 Tang Tan 法庭訴狀兩項聲明疊加,基本排除了 OpenAI 首款 AI 硬體涉足眼鏡、手錶、耳機等成熟賽道的可能。而關於這款裝置,Altman 自己已經劇透過很多次了:體積小巧,能塞進口袋也能擺在桌上,具備環境感知能力。重點是,它不是來搶手機和電腦飯碗的,而是要填補那些「不方便掏手機」或者「需要深度專注」的場景。他曾如此形容:智慧型手機是時代廣場,資訊轟炸、注意力粉碎。OpenAI 要做的,是一間「湖畔小屋」——讓你在需要專注時,能關上門,遮蔽噪音。從這個邏輯看,筆確實是個聰明的選擇。對比 Friend 那種 24 小時線上的 AI 吊墜,筆的認知門檻低,放桌上不突兀,隱私侵入感也比穿戴裝置低得多。Friend AI 吊墜設計層面,Ive 曾表示偏愛內在極度複雜智能,外在卻讓人想隨手觸摸、輕鬆使用的產品,甚至戲言,設計成功的終極標準是「讓人忍不住想舔一口、咬一口」。Altman 後續直接佐證了這一點:原型機的顏值,確實讓他產生了「想舔一口」的衝動,還精準概括其外觀——極簡優雅,又帶點俏皮與幽默感。Ive 還透露,這款 AI 硬體傾向於陶瓷等高質感材料,核心是追求「近乎天真的簡潔感」。據此可推斷,裝置互動會極度簡化,大機率只保留少量物理按鍵。除了產品理念與形態的高度契合,Jony Ive 與 Sam Altman 對「筆」的個人偏好,更讓這一猜想增添了幾分可信度。是的,Jony Ive 本身就是個資深筆具藏家。他的藏品涵蓋 Montegrappa 復古鋼筆、Marc Newson 設計的愛馬仕鋼筆。他的職業生涯早期就曾靠一款運動感十足的 TX2 圓珠筆賺到第一桶金,後續又深度參與 Apple Pencil 設計,對筆的形態設計積累深厚。由 Jony Ive 設計的 TX2Sam Altman 更是同道中人,甚至有過之而無不及。2024 年 9 月的《How I Write》播客中,Altman 自曝是「超級筆記控」,平均兩三周就能用完一本筆記本,還特別推薦了兩支筆:Uni-Ball Micro 0.5 和無印良品 0.36/0.37 款,搭配深藍色墨水最佳。用他的原話來說,「這類筆記本搭配其中一支筆,就是最理想的書寫組合」。早在 2018 年 4 月,他就在部落格裡寫過自己喜歡用紙筆記錄想法的好處:「我更喜歡寫在紙上的清單。這樣可以很方便地加入或刪除任務。開會時也能隨時查看,不會顯得不禮貌。」兩個對筆都有執念的人湊一塊,造出一支 AI 筆,似乎也順理成章。音訊模型狂飆 OpenAI 在憋 AI 硬體大招兩個愛筆的人造筆,顯然不會只是為了打造一批平平無奇的筆。據外媒 The Information 的爆料,OpenAI 正加速迭代音訊 AI 模型,核心目標就是為這款 AI 個人裝置築牢技術根基。知情人士透露,裝置將以語音互動為核心場景。過去兩個月,OpenAI 已完成工程、產品、研究多團隊的整合攻堅,全力最佳化音訊模型。目前新一代模型架構已初顯成效:不僅能生成更自然、更有人情味的語音回應,內容的精準性與深度也大幅提升。更關鍵的是,該模型將支援與使用者同步對話,能流暢應對打斷,預計今年第一季度正式發佈。報導稱,從去年夏天內部展示的方案來看,OpenAI 首款 AI 硬體的定位是「智能夥伴」——不是簡單的軟體介面,而是能主動與使用者協作,主動提供建議,幫使用者達成目標。在獲得使用者授權的前提下,它還能通過音視訊採集感知使用者及周邊環境,進一步提升互動精準度。目前 OpenAI 已組建覆蓋供應鏈、工業設計、模型研發的跨領域團隊,足見其對硬體賽道的野心。這個音訊 AI 項目的核心班底也已經敲定:負責人 Kundan Kumar 去年夏天從 Character.AI 跳槽加入;產品研究主管 Ben Newhouse 主導文字技術架構的音訊適配;多模態 ChatGPT 產品經理 Jackie Shannon 負責最佳化互動體驗,三人各司其職,構成項目支柱。但 OpenAI 面前橫亙著一個核心障礙:多數 ChatGPT 使用者還沒養成語音互動習慣。究其原因,現有語音模型體驗拉胯,以及使用者對這些功能認知為零。因此,報導直言,OpenAI 當務之急應該是先教會使用者「用語音跟 AI 對話」。而一旦這款裝置落地,且具備環境感知與線上聆聽能力,必將攪動現有 AI 硬體市場的格局——AI 錄音硬體可能迎來最強勁的對手。現有 AI 錄音硬體大多隻做錄音轉文字和摘要等功能;而 OpenAI 這款裝置若落地,錄音摘要只是其眾多原生技能之一,絕非全部。就像智慧型手機出現後順便幹掉了 MP3 播放器,當一個多場景通用裝置包含了你的所有功能時,垂直單品的生存空間就被徹底壓縮了。與此同時,按照硬體+訂閱的常規操作,OpenAI 大機率會把軟體服務直接打包進 ChatGPT 訂閱體系,憑藉龐大的使用者基數和極低的邊際成本,快速收割市場。值得一提的是,結合 OpenAI 的技術佈局與筆的形態,舊金山創業公司 Volley 創始人 Max Child 去年就曾提出了一個頗具想像力的猜想:這款 AI 筆頂部可能整合微型投影儀,將圖像投射到桌面,以此解決無螢幕互動的核心痛點。筆夾部分可能整合麥克風甚至攝影機,不僅能解析文字,還能感知更廣泛的環境。這意味著,使用者在任意紙張上書寫時,AI 不僅能將筆跡數位化,還能即時解讀內容:手寫數學公式,直接給出答案;手寫會議紀要,自動生成待辦事項並同步到手機。它甚至可能成為智能中樞:控制周邊數字介面,或作為平板電腦的高級輸入端,把 ChatGPT 的能力直接注入筆尖的創作中。由 Nano Banana Pro 生成的假想圖值得關注的是,知情人士還透露,OpenAI 並非只計畫發佈一款裝置,而是會陸續推出一系列裝置,以覆蓋更多元的使用場景。Altman 和 Ive 去年已親口證實,首批原型機已經造出,根據 The Information 的報導,首款 AI 裝置預計還要等約一年才會正式亮相。這個時間節點的規劃,也與當前 AI 硬體市場的競爭節奏相契合。科技巨頭們正加速佈局,搶灘 AI 硬體賽道:Meta、Google 都在悶頭做智能眼鏡;彭博社記者 Mark Gurman 爆料,蘋果也在考慮給 AirPods 加攝影機,打造新型 AI 裝置。在巨頭貼身肉搏的戰場之外,OpenAI 這樣一支能聽、能看、還能思考的 AI 筆,反而可能以極低的認知成本,撬開一個長期被忽略、卻高度專注的使用場景。而相比無處不在,這種只在需要時出現的 AI 硬體,或許才更接近下一階段的答案。 (創業邦)
是別針還是耳機?OpenAI首款AI硬體形態成謎
OpenAI加速商業化,硬體、廣告雙線佈局。圖片來源:unsplashOpenAI首款AI硬體裝置就要來了!當地時間1月19日,OpenAI首席全球事務官克里斯·萊恩(Chris Lehane)於瑞士舉辦的達沃斯論壇上表示,裝置是公司今年的重要規劃之一,按照計畫,有望在今年下半年推出首款產品。不過,克里斯·萊恩並未針對裝置的形態、細節或具體發佈時間給出任何確定資訊。Axios首席技術記者伊納·弗雷德(Ina Fried)在Axios House活動現場追問“是別針嗎?”“是耳戴裝置嗎?”,克里斯·萊恩均未置可否。“大家可是在這裡首次得知這一消息的,這款裝置今年就要來了。”弗雷德進而確認道。“我沒說它今年一定會來,我是說我們正按計畫進行中。”萊恩依然謹慎回應稱。截圖來自Axios House活動視訊在萊恩官宣之前,市場普遍預期OpenAI會在今年推出智能硬體裝置。去年5月,OpenAI以65億美元收購了前蘋果首席設計官喬納森·伊夫(Jony Ive)的AI裝置初創公司io,彼時的一段宣傳視訊即暗示2026年會有新品面世,成為使用者的“AI夥伴”。此後,OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)多次對這款備受市場關注的產品給出“劇透”。其中涉及的細節包括:體積小而輕便、設計簡潔、無螢幕、注重使用者互動尤其是語音互動、具有物理世界感知能力等。坊間隨即有了這款硬體是別針、耳機、無屏音箱等猜測。去年12月末,數位博主智慧皮卡丘在社交平台爆料稱,OpenAI共有3個項目在進行供應商評估,其中之一被認為是一支筆,另一種可能是可攜式音訊裝置。1月中旬,該博主跟進爆料稱,一款內部代號為“Sweetpea”的“旨在取代蘋果AirPods的特殊音訊裝置”被排在硬體裝置開發優先順序的首位,預計將在今年9月左右發售,年度出貨量計畫可能高達4000萬至5000萬個的水平。爆料還稱,供應鏈企業已被告知,OpenAI計畫在2028年四季度前共生產5款裝置,家用裝置和觸控筆仍在考慮之列。截圖來自社交平台X此外,The Information在1月1日引用信源稱,OpenAI計畫推出的首款硬體裝置的原型機已經完工,該公司正加速迭代音訊模型,為這款“以語音互動為核心場景”的裝置提供支援。相關報導稱,其音訊模型預計將在今年一季度發佈,相關裝置可能在一年左右的時間內走向市場。而在預測市場平台Polymarket上,有85%的使用者押注OpenAI將在今年結束前面向消費者推出其硬體裝置。目前,AI硬體裝置已成科技巨頭、獨角獸和眾多創業者搶灘AI消費市場的重要選擇。Meta、Google、阿里巴巴等聚焦於目前最火爆的AI眼鏡賽道,蘋果此前也被認為有意將Airpods耳機升級成AI裝置,相關智能翻譯等功能已推出。此外,戒指、耳環、掛件、錄音豆等“標新立異”的AI硬體產品也層出不窮。但市場始終未給出如智慧型手機、智能手錶般的一致性、規模化積極反饋,這也是市場高度重視OpenAI將拿出怎樣革新性產品的原因所在。至於OpenAI,這家估值已高達5000億美元(新一輪融資完成後或將達到8300億美元),年營收剛剛超過200億美元,5年內資本支出可能逼近5000億美元的AI公司,通過各種管道探索商業變現已成當務之急。此前,OpenAI已陸續推出多種C端和B端的服務套餐以及AI購物功能,1月16日,它還公告稱,將在ChatGPT中上線並測試廣告功能。然而,這一舉措也一度因有違奧爾特曼“最後才會考慮廣告”言論,可能讓AI受商業利益影響給出傾向性答案而遭受爭議。萊恩在上述訪談中也談到,引入廣告的核心目的是為了維持免費服務的可持續性,通過廣告收入來支付高昂的算力成本,從而確保數億使用者能夠繼續“像使用公共事業一樣”免費使用AI,避免因經濟能力差距而造成更大的數字鴻溝。他還強調,公司對廣告的引入有嚴格的標準和原則,會始終以使用者體驗和信任為首要考量,確保廣告不干擾核心對話、使用者始終能感覺到在獲取所需答案。他也同時表示,行業還需進一步建立標準和規則,來規範AI廣告的說服力、透明度等。在從非營利組織轉型為混合架構,繼而積極參與商業競爭後,OpenAI在輿論和法律層面一直面臨爭議。目前來看,該公司將避免AI“能力溢出”(capability overhang)的平權理唸作為自己加速商業化的重要理由。OpenAI此前表示,將在達沃斯論壇期間發佈一份名為《終結能力過剩》(Ending the Capability Overhang)的報告,揭示在AI創新速度超過採用速度之際,活躍採用者相較普通使用者正在獲得巨大的智能優勢和收益的事實。而公司則主張必須彌合這種差距,才能讓AI真正有利於整體的社會和經濟利益,避免其最大收益只流向那些具備先發資源優勢和活躍採用管道的國家、企業或個人。而正如萊恩所解釋的,通過商業變現支撐OpenAI自身的運行,被該公司視為彌補差距、讓AI普惠化的必要舉措。截圖來自OpenAI官網OpenAI首席財務官薩拉·弗萊爾(Sarah Friar)在1月18日發表的文章《一個能夠根據智能價值擴展的企業》(A business that scales with the value of intelligence)中強調了商業變現與AI平權間的關聯。她稱,公司遵循“商業模式應隨著智能帶來的價值而擴展”的簡單原則,並以此來推動完成最初的承諾。她還提到,該公司今年的重點將放在“實際應用”上,特別是在健康、科學和企業領域。“首要任務是縮小AI現有能力與人們、企業和國家日常使用方式之間的差距。”她寫道,“基礎設施擴展服務範圍,創新擴展智能的能力,實際應用擴展其使用範圍,而商業收入則推動我們走向下一個階段,這就是智能如何發展並成為全球經濟基礎的方式。” (鈦媒體AGI)
2nm晶片,OpenAI想用AI耳機打爆iPhone?
“由軟到硬”,OpenAI正在推進其成立以來最具戰略意義的一次嘗試。日前,據長期爆料蘋果新產品資訊的供應鏈從業者“智能皮卡丘”披露,OpenAI正在推進內部代號為“Sweetpea” 的隨身AI硬體項目——以語音互動為中心的音訊裝置。據瞭解,Sweetpea項目隸屬OpenAI內部的“To-go”硬體體系,有多種形態裝置同步進行研發,包括家用形態AI終端與AI智能筆等。富士康已被要求,為截至2028年第四季度共五款裝置提前進行產能準備。另外,由於富士康在AirPods代工競爭中幾乎全面失利,Sweetpea被視為富士康重新切入下一代音訊與互動硬體核心賽道的重要機會。Sweetpea摒棄入耳式方案,採用耳後佩戴設計,主裝置採用金屬材質,整體形態類似一塊“蛋石”,內部包含兩枚可拆卸的膠囊式模組,實際佩戴時固定於耳後,面向全天候、去螢幕化的語音使用場景。“Sweetpea” 的物料清單的成本更接近一部智慧型手機,而非傳統耳機產品。這意味著,OpenAI正試圖繞開智慧型手機這一既有入口,重新定義個人計算的起點。現有智能裝置,無論是手機、電腦還是家居終端,都遵循“先喚醒再操作再呼叫智能能力”的邏輯。生成式AI只是嵌入其中,成為“更聰明的功能”。Sweetpea試圖打破這一順序:它不要求使用者主動啟動,目標是在使用者開口的第一瞬間捕捉意圖,讓AI成為“默認存在”的第一響應者。據透露,Sweetpea主處理器將採用2奈米製程的智慧型手機級晶片,並輔以定製晶片,使裝置能夠通過語音指令直接呼叫Siri。裝置音訊模型同樣經過最佳化,可表現自然情緒並處理即時插話,這是Sweetpea能否擺脫“語音助手”標籤、晉陞為全功能AI助理的關鍵。不過,然而業內對這類產品的態度謹慎。分析師本·格倫尼指出:“這對OpenAI可能是一場艱難戰鬥……幾十年的蘋果硬體經驗很可能勝過Sweetpea的首發優勢。”站在蘋果的視角,它也在系統層面加速整合ChatGPT技術,將AI功能深度嵌入iOS,同時與Google強化語音助手和雲服務互通,通過AirPods、Apple Watch、HomePod建構多終端協同網路,防止新興裝置打破護城河。 (騰訊科技)
前華為員工創業AI翻譯耳機,拿下全球第一,年收入2億
2016年,前華為工程師團隊錨定語言服務賽道,以5秒極速翻譯延遲與90分貝降噪技術攻克跨國溝通痛點;2023年登頂美國亞馬遜翻譯裝置銷冠,服務網路遍及170個國家和地區……中國硬體品牌如何以“自然對話邏輯+垂直場景深耕”,在AI翻譯紅海築起技術護城河?基於此,我們與時空壺CMO吳衛兵聊了聊。時空壺創始人田力決定創業,是在他母親的一次意外後。2015年,田力父母決定去歐洲旅遊。出發前,田力的媽媽下載了滿屏翻譯軟體,田力還專門給老兩口準備了翻譯機。到了國外,翻譯機出乎意料地難用,簡單地買瓶水都要等機器反應很長時間。旅途行至瑞士法語區的一座高山時,意外發生了。語言問題變得生死攸關。田力的母親感覺身體不太對勁,頭疼乏力,疑似高原反應。兩人匆忙趕往當地醫院,卻發現居然完全無法交流。面對急診護士,老兩口對著翻譯機急促說話,卻因語速過快導致翻譯結果支離破碎。當老兩口沒辦法,用手拚命比劃時,護士又在埋頭研究翻譯機。很多時候,中文和法語你來我往,彼此聽不懂一句話。一段焦灼的語言真空帶就這樣橫亙在生死時刻。他們又花了些時間,終於把握到翻譯機的節奏,必須放慢語速、逐字吐詞,這才勉強能交流。當聽父母說起這件事,田力一瞬間脊背發涼:如果母親不是高反而是更嚴重的疾病,是否已經發生不可挽回的後果?他對跨語言溝通障礙並不陌生,此前的商務溝通中一些商務談判經常用到翻譯軟體。彼時他沒想過自己去改變現狀。離開華為後,他到了一家機器人公司,主導硬體開發。想過創業,卻沒看到什麼機會。父母在歐洲的經歷算是給他一種啟發。根據世界衛生組織資料,全球超過10億人因語言障礙無法自由溝通。從手持翻譯機到手機APP,傳統解決方案始終未能解決“自然對話”的痛點。“吵架時,沒人願意舉著翻譯機來回傳遞。”田力這樣說過。顯然,這是個廣闊而未被滿足的市場。而田力希望能做一款“讓人忘記翻譯存在的裝置”,最貼近他想法的就是入耳式耳機。2016年,田力找到大學同學,聯合幾個工程師,成立時空壺品牌,開始做可穿戴翻譯耳機。他們經歷過產品大失敗、方向的調整,到2020年才推出第一款真正成功的耳機M2,這款產品當年迅速賣出10萬台。2023年,時空壺登上美國亞馬遜翻譯裝置銷量榜首。2024年,時空壺又推出了W4Pro系列,總體營收超過2億元。翻譯硬體是個傳統產品。海外來看,目前市佔全球第二的日本Post主打手持翻譯機Talkmate因技術迭代緩慢逐漸退出市場(已三年未更新產品),而Google、蘋果等大廠則聚焦於AI語音助手與耳機功能整合(如Pixel Buds Pro的即時翻譯),尚未形成規模化硬體。至於國內,市場上主要還是科大訊飛為首的翻譯機。時空壺選擇了AI翻譯耳機這個相對新穎的模式,並做出了技術壁壘。在亞馬遜上,它們是華強北廉價翻譯耳機外唯一的品牌商家,所以即便價格和AirPods相當,也有不錯銷量。當然,時空壺的生意還遠談不上穩定。ChatGPT開啟AI大模型浪潮後,翻譯質量和速度都上了一個台階。如果硬體大廠下場整合,將直接刺入創業公司的領土。終極訴求最初,在田力的認知裡,做翻譯硬體是一個很小的事情,只需要找個軟體外包公司合作就能解決。但隨著不斷地深入,田力發現,想要真正實現跨語言溝通,必須儘可能地還原母語交流時地場景,現有的方案根本無法滿足需求。“使用者要的不是翻譯,是自然對話。”時空壺CMO吳衛兵告訴硬氪。他們經歷了慘痛的教訓才明白這一點。2017年,時空壺首款翻譯耳機WT2 Plus登陸Kickstarter,憑藉“即時翻譯”概念眾籌超百萬美元。但當極客們戴上耳機測試時,反饋卻令人尷尬:對話雙方需嚴格遵循“說完-等待-播放”的節奏,稍有插話就會導致翻譯混亂。“像和機器人對暗號。”一位早期使用者抱怨。2018年,他們又嘗試了一款即插即用裝置,卻因收音缺陷滯銷20萬台,損失上千萬,將公司逼到懸崖邊緣。這次失敗讓團隊徹底轉向耳機品類,並錨定兩大技術痛點:即時性與抗噪能力。傳統翻譯機的序列處理模式(收音-翻譯-播放)導致至少2秒延遲,而藍牙協議的頻寬限制進一步加劇資料擁堵。轉機出現在技術路徑的“暴力拆解”,時空壺團隊將單通道藍牙拆分為四通道(雙耳獨立處理上傳與下載),如同在單車道馬路上強行開闢四條平行車道。“就像在耳機裡建交通樞紐。”吳衛兵形容,“稍有不慎,左右耳資料就會‘撞車’,翻譯結果變成亂碼。”他們花了18個月才最終實現“邊說邊譯”功能,將對話效率提升2倍。抗噪則是另一場硬仗。在東京澀谷的測試中,環境噪音導致翻譯精準率暴跌至70%。時空壺團隊開發出RNNVAD人聲識別演算法,通過聲源方向鎖定與距離感知,過濾90%背景噪音。“我們甚至要求工程師戴著耳機去夜店測試,確保在90分貝環境下仍能精準收音。”吳衛兵說。這項技術讓翻譯精準率在鬧市區提升至93%,酒吧點單、機場問詢等場景得以實現。技術取捨始終是研發過程中的核心挑戰。2021年,團隊為壓縮翻譯延遲,一度簡化演算法校驗流程,卻導致商務場景翻譯精準率下降。某跨境貿易公司反饋,耳機將合同中的“不可抗力條款”誤譯為“無力條款”,引發法律風險。“錯誤翻譯比等待更致命。”吳衛兵在內部復盤會上強調。此後,團隊開始做出調整,日常對話呼叫Google、微軟等六大翻譯引擎,覆蓋通用需求,醫療、法律等垂直領域則建立自己的專用術語庫。據第三方測試報告,在涉及“冠狀動脈搭橋術”等醫學名詞時,時空壺翻譯精準率從通用引擎的76%提升至92%。為平衡專業性與易用性,他們還增設“場景模式”功能——商務談判時採用正式書面語,旅行場景則自動切換為口語化表達。比如,一位經常出差的使用者舉例:“‘Let’s talk tomorrow’在商務模式下譯為‘煩請明日再議’,旅行模式下則是‘明兒再聊’。”在M2推出後,時空壺終於爬出了低谷。他們接著推出M3、W3,熱度越來越高。2023年,時空壺登上美國亞馬遜翻譯裝置銷量榜首。但此時,真正的戰鬥剛剛開始。山寨圍剿,B端破局沒有什麼電子產品,是華強北無法山寨的。當時空壺成為細分品類第一時,深圳華強北的白牌廠商們自然聞風而動,推出“19.9美元AI翻譯耳機”,有的在TikTok用“跨國情侶甜蜜對話”短影片行銷,單月銷量衝到20萬台。這些產品實為公模耳機搭配開源翻譯APP,實測延遲達3秒,退貨率超40%。整個行業都步入晦暗。“山寨機毀掉的是整個品類認知。”吳衛兵苦笑。更棘手的是,低價策略吸引大量首次使用者,他們誤以為“AI翻譯就該這麼便宜”,迫使時空壺投入雙倍預算教育市場。面對山寨機的低價衝擊,時空壺選擇了一條雙軌平行的防禦路線。在C端市場,團隊推出售價1299元的T1新銳版,保留“雙向同傳”核心功能,但將離線語言從40種縮減至13種。“我們像做手機裡的‘青春版’,砍掉非必要功能,但必須守住技術底線。”吳衛兵解釋。這款產品在亞馬遜Prime Day期間沖上翻譯裝置銷量前三,成功攔截下部分價格敏感使用者。B端成了華強北廠商無法觸達的戰場。時空壺的確能拿出過硬的翻譯指標:5秒超低延遲秒與90分貝環境降噪——前者是離線翻譯延遲速度(手機依賴網路延遲),後者是只識別說話者聲音的定向降噪能力(手機麥克風在同等環境精準率不足50%)。技術表現成為企業支付溢價的關鍵。2023年,時空壺萬豪、希爾頓達成合作,將翻譯耳機植入酒店服務體系——外籍旅客入住時可租賃設備,日租金僅為人工翻譯成本的1/10。在深圳盈科律師事務所,律師們甚至將耳機寫進保密協議條款:“客戶對話必須通過我們的裝置,禁止使用第三方翻譯軟體。”吳衛兵回憶。B端使用者對效果極其敏感,時空壺的產品達到了他們的預期。深圳雲杉醫療的護士接待外籍患者時,用他們的耳機後,誤診率下降40%。深圳機場導遊靠耳機對接海外地接社,投訴率下降75%,墨西哥城某教堂用耳機雙語禮拜,信徒首次參與英語聖經討論。“大廠可以複製功能,但軟硬一體化的Know-how需要三年沉澱。”吳衛兵表示。目前時空壺覆蓋40種語言、93種口音,平均精準率超95%,在醫療、法律等專業領域表現尤為突出。他們近六成營收來自亞馬遜,獨立站與線下管道均攤其餘部分,產品覆蓋170個國家。成立以來,他們見證了很多故事。曾有一個美國使用者Christian來感謝他們,他的妻子是委內瑞拉人,日常與妻子和岳父岳母溝通需頻繁使用耳機,他稱“產品拯救了婚姻”;也有日本使用者通過耳機向醫生精準描述了急性闌尾炎症狀。未來三年,行業競爭或將聚焦多模態翻譯(語音、文字、圖像協同)與垂直場景深化。AI大模型的逐漸成熟,也給時空壺這樣的創業公司帶來更多緊迫感。無論如何,當硬體參數競賽趨於白熱化,時空壺的突圍背後,仍是一個樸素的理想:技術的終極價值,在於讓人重新成為人。他們無需學習語言規則,不必適應機器邏輯,只需如本能般開口說話。“說到底,我們不是一家純粹做耳機的公司,而是解決跨語言溝通問題。”吳衛兵說。 (硬氪)
海思新晶片,來了
即將推出支援星閃的耳機晶片。上海海思昨日發文宣佈其蜂窩表芯即將量產,手錶可變獨立輕智能終端。智能手錶行業正面臨著結構性矛盾。全球年出貨量2億台,僅1700萬台具備蜂窩通訊能力。在全民健身熱潮催生獨立通訊需求的背景下,市場卻存在雙重桎梏,消費端千元級價格壁壘與技術端中小廠商能力斷層。上海海思通過晶片+模組+解決方案+生態資源整合,即將推出“一站式”鴻蒙蜂窩表芯方案。該方案提供標準化的鴻蒙表芯介面,中小廠商僅需專註上層應用和ID,即可快速推出差異化的鴻蒙蜂窩手錶產品,破解高價壁壘、技術挑戰和長研發週期的難題。上海海思鴻蒙蜂窩表芯方案具備六大優勢:蜂窩通訊、鴻蒙生態、2.5D GPU、智能語音、高精定位、有源NFC。上海海思還將進一步佈局下一代智能表芯平台,深度融合星閃連接、OpenHarmony系統、端側AI,以“三位一體”為使用者打造更智能的互動體驗。蜂窩通訊:支援自研4G Cat1 modem,無手機狀態可撥打電話、播放線上音樂;具備業界領先靈敏度(<-100dbm),保障通訊穩定;待機功耗小於180uA,續航超5天,解決蜂窩表“一天一充”痛點。OpenHarmony:搭載穿戴級OpenHarmony作業系統,北向整合統一應用市場與表盤市場,支援應用自由安裝、升級、解除安裝;南向實現IoT裝置互聯互通。2.5D GPU:支援24bits真全彩顯示,60幀絲滑操控;適配影片播放、視訊表盤,以及高斯模糊、無極秒針、向量文字、貝塞爾曲線等高端UI體驗。智能語音:具備AI降噪、離線AI語音、AI降風噪技術,提供高品質語音體驗。高精定位:基於5星座GNSS、AI場景識別與空間感知,實現低功耗高精度定位。有源NFC:支援門禁功能,以及“碰一碰”互聯(如傳表盤)。目前市面上暫未出現支援星閃技術的耳機產品,僅出現採用相關技術的產品,其中:華為 FreeBuds Pro 3 耳機是全球首款應用星閃連接核心技術和藍牙技術的耳機,配合支援星閃的裝置,基於 Polar 碼技術,業界首發 1.5Mbps 無損傳輸;FreeBuds Pro 4 是應用星閃連接核心技術和藍牙技術的耳機,基於 Polar 碼技術,搭配 Mate 70 系列手機及 Mate X6 等機型,搭載 HarmonyOS 4.3 及以上版本時最高可實現 2.3 Mbps 無損音質。需要注意的是,華為 FreeBuds 6 / FreeBuds Pro 3 和 FreeBuds Pro 4 耳機均支援藍牙連接,不支援星閃連接。據此前報導,在 2023 年 8 月的 HDC.Together2023 上,余承東表示,星閃相比傳統無線連接,功耗降低至 60%,數傳速率達到 6 倍,時延降低至 1/30,連線達到 10 倍。AI耳機,頻頻出新與傳統耳機相比,AI耳機晶片整合了更多的智能功能,如語音識別、智能降噪、健康監測等,為使用者提供更加便捷、個性化的體驗。AI晶片的加入,使得耳機能夠即時處理音訊訊號,提供更加純淨、自然的音質。隨著AI技術的不斷進步,未來AI耳機晶片有望實現更多創新功能,為使用者帶來更加智能化、人性化的使用體驗。據頭豹研究院預計,2024至2028年,AI智能耳機行業市場規模將由73.18億元增長至1646.75億元,CAGR為117.80%。隨著AI技術的不斷進步和市場需求的增長,AI晶片行業的主要競爭者正通過技術創新和產品迭代,推動行業的快速發展。2024年以來,市面上已有多家廠商在TWS、開放式等多種耳機品類中加入語音互動、即時翻譯等AI相關的功能,如Cleer、科大訊飛、三星、字節跳動、華為、Redmi等廠商已發佈AI耳機產品。2024年2月,iKKO在國內上市ActiveBuds,自帶AI語音助手(chatGPT)、45種語言同聲翻譯、音樂獨立串流、EQ功能、支援WIFI/4G/藍牙5.3等有別於傳統TWS的功能。2024年4月,Cleer推出了全球首款開放式AI耳機Cleer ARC 3音弧,內建了Gomore研發的先進AI運動演算法,可幫助使用者即時監控運動生理資料,為其提供更精準更科學的運動指導,打造使用者私人的AI健身教練。2024年4月,漫步者AI演算法通過網信備案並掛網公示,後續或將應用於公司的AI耳機新品。2024年,科大訊飛發佈了訊飛會議耳機iFLYBUDS 2,支援VIAIMAI進化大模型,可一鍵生成會議摘要總結、待辦事項,支援AI會議助理有問必答、32國語言同傳翻譯,支援閃錄音功能,支援免費錄音轉文字等AI功能。2024年11月,華為首款搭載HarmonyOS NEXT(原生鴻蒙)的TWS耳機華為FreeBuds Pro 4登場,可接入小藝智能體,支援智慧問答、智慧播報、快提醒,還能實現面對面翻譯、同聲傳譯等智能功能。2024年11月,Redmi發佈了新一代TWS耳機Redmi Buds 6系列,不僅支援最高55dB的降噪深度,還加入了此前各家旗艦級產品才有的無極動態降噪。 (半導體產業縱橫)